老姚专栏 | 比率的统计学——大道至简的典范
本文首发于今晚报(2020-08-17)
原标题为《鱼塘里有多少鱼》,本推文有修订。
启研学社由知名学者担任学术顾问,高校师生与企研数据科学团队联合组建,以大数据资源及相关技术助力中国学术与智库研究为宗旨的研究组织。团队当前的主要目标是挖掘经济社会大数据资源在学术和智库领域的应用价值,开展学术大数据治理研究,以及探索大数据分析技术融入中国经济社会研究的可行进路。
假设有黄豆与绿豆各若干粒混装在一个较大的容器中。若要估计容器中黄豆与绿豆的粒数之比,我们有什么好办法呢?
统计学给出的解决方案是:
首先,将容器中的豆子搅拌均匀,并从中抓取一大把作为样本;然后,数一数样本中黄豆与绿豆各有多少粒,并计算比率;最后,我们将这个样本比率作为估计值。
上述简单案例凸显了统计推断之精髓——通过样本的特征来推断总体的特征。在这里,样本比率反映了样本的特征,而容器中黄豆与绿豆的粒数之比就是需推断或者说估计的总体比率,其反映了总体的特征。用样本比率估计总体比率,当然是因为随着样本容量的增加,两者可以很接近,而这就是比率的统计学。此原理简单而深刻,很多时候能为一些看似棘手的问题提供漂亮的解决方案。
例如,假设一位农户要求我们估算他的鱼塘中有多少条鱼。乍一听,这似乎是一个无从下手的问题。然而,比率的统计学能巧妙地给出答案。
具体来说
首先,我们不妨从鱼塘中捕捉一些鱼,比如100条,并做上标记,然后将这些鱼放回鱼塘。若记鱼塘中共有X条鱼,则有标记的鱼与鱼塘中总鱼数的比率等于100:X,此乃总体比率。然后,通过一些方法尽量让有标记的鱼与其余的鱼均匀地混合在一起。最后,我们从鱼塘中捕捉一些鱼作为样本,以获得样本比率——比如,在捕捉到的150条鱼中,有15条鱼带有标记,则样本比率等于15:150。一旦获得样本比率,根据比率的统计学,就可以估算出鱼塘中到底有多少条鱼——100:X≈15:150。因此,X大约等于1000。
再如,假设一位从事房地产行业的朋友要求我们估算一块地皮的面积,而此块地皮的形状十分不规则。鉴于这位朋友已根据一定的比例尺,在一张A4纸上将此块地皮绘成了地图,我们的任务就简化为估算地图的面积。难道比率的统计学也可用来估算不规则图形的面积?有点不可思议,不过其中的逻辑其实挺简单。
具体过程是
我们首先将这张A4纸平摊在地板上,然后从厨房抓来一把米撒向这张纸。
接下来,我们数一数地图上有多少粒米,而整张A4纸上又有多少粒米。若将计数的结果分别记为M与N,则样本比率等于M:N。那么,这里的总体比率是什么呢?这是一个几何概型问题,不过答案是富有直觉的,那就是总体比率等于地图面积与A4纸面积之比。根据比率的统计学,此总体比率与样本比率M:N近似相等,故有:地图面积≈A4纸面积×M/N。由于A4纸为长方形,其面积很容易被测量,地图面积就相应地被估算出来。
有趣的是,若稍加引申,则我们还能掌握一个估算圆周率π的统计学方法。具体来说,假设上述案例中的不规则图形是一个圆,那么利用比率的统计学,我们可估算出这个圆的面积S。根据圆的面积公式有:π=S/r^2,其中r^2代表圆半径的平方。因此,一旦S被估算出来,r被测量,就可以获得π的估计值。
大道至简、大简致用,比率的统计学就是经典的例子。
企研数据创始学术顾问 · 姚耀军
姚耀军,1976年出生,湖北利川人,浙江工商大学金融学院教授,博士生导师,浙江省高校中青年学科带头人,浙江省首期之江青年社科学者,企研数据创始学术顾问。曾获中国制度经济学年会优秀论文奖、全国金融硕士教学案例大赛优秀案例奖、浙江省高校优秀科研成果一等奖、《金融研究》优秀论文奖、《财经研究》创刊60周年优秀论文一等奖等荣誉。担任《金融研究》《财经研究》等多个学术期刊的审稿专家。研究领域:金融发展理论与实证、应用计量经济学。
邮箱:yaoyaojun@163.com
代表论文:
[1]姚耀军,施丹燕.互联网金融区域差异化发展的逻辑与检验——路径依赖与政府干预视角[J].金融研究,2017(05):127-142.
[2]姚耀军.制度质量对外资银行进入的影响——基于腐败控制维度的研究[J].金融研究,2016(03):124-139.
[3]姚耀军,董钢锋.中小企业融资约束缓解:金融发展水平重要抑或金融结构重要?-来自中小企业板上市公司的经验证据[J].金融研究,2015(04):148-161.
点击阅读原文,进入CCAD数据库
·END·
星标⭐我们不迷路!
想要文章及时到,文末“在看”少不了!
往期推荐
数据Seminar
这里是大数据、分析技术与学术研究的三叉路口
文 | 姚耀军
欢迎扫描👇二维码添加关注